分析大会で利用を推奨する新型コロナウィルスに関するデータです。すべてオンラインで最新データが取得できます。
| データ | 区分 | 種別 | 形式 | DL | 備考 |
|---|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | CSV | 可 | 集計データを個別ファイルで公開 |
| Covid19 Japan | 公開 | 個票・集計 | JSON | 可 | GitHubにて公開 |
| JAG Japan | 公開 | 個票 | CSV | 可 | GIS処理用データ付き |
その他のデータを利用した場合にはデータの出典と概要説明を明示してください。
分析大会で利用を推奨する新型コロナウィルスに関するデータです。すべてオンラインで最新データが取得できます。
| データ | 区分 | 種別 | 形式 | DL | 備考 |
|---|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | CSV | 可 | 集計データを個別ファイルで公開 |
| Covid19 Japan | 公開 | 個票・集計 | JSON | 可 | GitHubにて公開 |
| JAG Japan | 公開 | 個票 | CSV | 可 | GIS処理用データ付き |
その他のデータを利用した場合にはデータの出典と概要説明を明示してください。
日本の公式データ。国内事例(チャーター便を除く)のみの集計(サマリ)データでCSV形式。
厚生労働省のデータはファイルにより単日であったり集計値であったりしますので、サイトの注意書をよく読んでください。意外とトラップがあるので河野行政改革担当大臣またはデジタル庁(仮称)に期待。
| データ | 備考 |
|---|---|
| 陽性者数 | 新規に陽性と判断された者の数 |
| PCR検査実施人数 | |
| 入院治療等を要する者の数 | 入院待機中・確認中を除く |
| 退院又は治療解除となった者の数 | |
| 死亡者数 | |
| PCR検査の実施件数 | 暫定数値であり後日変更される可能性あり |
Exploratory EDA Salonなどで紹介されている有志によるJSON形式データ。個票データは素直に扱えますが集計データはネストしています。
GitHub からjsonliteパッケージを利用して以下のコードで読み込んでください。
library(jsonlite)
path <- "https://raw.githubusercontent.com/reustle/covid19japan-data/master/"
path <- paste0(path, "docs/patient_data/")
path %>%
paste0("latest.json") %>%
readr::read_lines() %>%
paste0(path, .) %>%
jsonlite::fromJSON()
個票データへのパスですが表示の都合上、分割しています。
各列(変量、フィーチャー)の定義はこちら。
ジャッグジャパンによるGISプロモーションも兼ねて公開しているデータ。
特徴的なのはW列(23列)目以降にGIS処理用の変量(フィーチャー)が用意されている点です。これらの変量は分析には必要ありませんので、削除しておくことをおすゝめします。また、インスタンスには多数の揺れが含まれている点に注意してください。
なお、読み込み時は以下のオプションを指定しないとWinodws環境ではエラーになります。
readr::read_csv(locale = readr::locale(encoding = "UTF-8"), guess_max = 5000)
各列(変量、フィーチャー)の定義は こちら。
tidyverseパッケージを必ずインストール
readrならびにjsonliteパッケージはtidyverseパッケージに含まれますreadr::read_csv関数で
localeオプションを指定してくださいreadr::write_excel_csv(df, filepath) で書き出せます